在不完整的数据集中对样本进行分类是机器学习从业人员的普遍目的,但并非平凡。在大多数现实世界数据集中发现缺失的数据,这些缺失值通常是使用已建立的方法估算的,然后进行分类现在完成,估算的样本。然后,机器学习研究人员的重点是优化下游分类性能。在这项研究中,我们强调必须考虑插补的质量。我们展示了如何评估质量的常用措施有缺陷,并提出了一类新的差异评分,这些分数着重于该方法重新创建数据的整体分布的程度。总而言之,我们强调了使用不良数据训练的分类器模型的可解释性损害。
translated by 谷歌翻译
电子医疗记录(EHR)是非常稀少。只有事件(症状,诊断和治疗)的一小部分在个体的生命周期中观察到。 EHR的missingness的高度可以归因于大量的因素,包括设备故障,隐私问题,或其他意外原因。不幸的是,许多传统的估算方法是不适合于高度稀疏的数据和规模,高维数据集不佳。在本文中,我们提出了一个基于图形的估算方法,既稳健的稀疏和不可靠的不可测事件。我们的做法相比,毫不逊色于一些标准和国家的最先进的估算方法在性能和运行方面。此外,结果表明,该模型学会在临床上有意义的方式嵌入不同的事件类型。我们的工作可以促进基于过去事件的临床病史新型疾病的诊断,有潜力,以增加我们的合并症景观的理解。
translated by 谷歌翻译
Our earlier research built a virtual shake robot in simulation to study the dynamics of precariously balanced rocks (PBR), which are negative indicators of earthquakes in nature. The simulation studies need validation through physical experiments. For this purpose, we developed Shakebot, a low-cost (under $2,000), open-source shake table to validate simulations of PBR dynamics and facilitate other ground motion experiments. The Shakebot is a custom one-dimensional prismatic robotic system with perception and motion software developed using the Robot Operating System (ROS). We adapted affordable and high-accuracy components from 3D printers, particularly a closed-loop stepper motor for actuation and a toothed belt for transmission. The stepper motor enables the bed to reach a maximum horizontal acceleration of 11.8 m/s^2 (1.2 g), and velocity of 0.5 m/s, when loaded with a 2 kg scale-model PBR. The perception system of the Shakebot consists of an accelerometer and a high frame-rate camera. By fusing camera-based displacements with acceleration measurements, the Shakebot is able to carry out accurate bed velocity estimation. The ROS-based perception and motion software simplifies the transition of code from our previous virtual shake robot to the physical Shakebot. The reuse of the control programs ensures that the implemented ground motions are consistent for both the simulation and physical experiments, which is critical to validate our simulation experiments.
translated by 谷歌翻译
为偏置场校正和磁共振归一化问题提出了空间正则化的高斯混合模型LAPGM。提出的空间正常化程序为从业者提供了平衡偏置磁场去除和保存图像对比度之间的微调控制,以提供多序列的磁共振图像。LAPGM的拟合高斯参数用作控制值,可用于在不同的患者扫描中标准化图像强度。将LAPGM与单个和多序列设置中的众所周知的词汇算法N4ITK进行了比较。作为一种归一化程序,将LAPGM与已知技术(例如:最大归一化,Z得分归一化和水掩模的利益区域归一化)进行比较。最后,由作者提供了cuda加速python软件包$ \ texttt {lapgm} $。
translated by 谷歌翻译
从单个图像中恢复人头的几何形状,同时对材料和照明进行分解是一个严重不良的问题,需要事先解决。基于3D形态模型(3DMM)及其与可区分渲染器的组合的方法已显示出令人鼓舞的结果。但是,3DMM的表现力受到限制,它们通常会产生过度平滑和身份敏捷的3D形状,仅限于面部区域。最近,使用多层感知器参数化几何形状的神经场获得了高度准确的全头部重建。这些表示形式的多功能性也已被证明可有效解开几何形状,材料和照明。但是,这些方法需要几十个输入图像。在本文中,我们介绍了Sira,该方法从单个图像中,从一个图像中重建了具有高保真度几何形状和分解的灯光和表面材料的人头头像。我们的关键成分是基于神经场的两个数据驱动的统计模型,这些模型可以解决单视3D表面重建和外观分解的歧义。实验表明,Sira获得了最新的状态导致3D头重建,同时它成功地解开了全局照明以及弥漫性和镜面反照率。此外,我们的重建适合基于物理的外观编辑和头部模型重新构建。
translated by 谷歌翻译
人类语言中发现的最强大的模式之一是ZIPF的缩写定律,即更短的单词的趋势。自ZIPF开创性研究以来,该定律被视为压缩的体现,即形式的长度最小化 - 自然交流的普遍原则。尽管对语言进行优化的说法已经变得时尚,但衡量语言优化程度的尝试却相当稀缺。在这里,我们证明压缩在无例外的大量语言中表现出来,并且独立于测量单位。这两个单词长度都可以在书面语言的字符以及口语的持续时间中检测到。此外,为了衡量优化程度,我们得出了一个随机基线的简单公式,并提出了两个分数归一化的分数,即,它们相对于最小值和随机基线都进行了归一化。我们分析了这些和其他分数的理论和统计优势和缺点。利用最佳分数,我们首次量化了语言中单词长度的最佳程度。这表明当单词长度以字符测量时,语言平均被优化至62%或67%(取决于源),当单词长度及时测量时,平均而言,平均而言,平均而言,平均而言,平均而言,平均而言,平均至65%。通常,口语持续时间比字符中的书面单词长度更优化。除了这里报告的分析外,我们的工作还铺平了衡量其他物种发声或手势的最佳程度的方法,并将其与书面,口语或签名的人类语言进行比较。
translated by 谷歌翻译
使用数学模型(例如易感性暴露于易感性的(SEIR)(SEIR),Logistic回归(LR))和一种称为多项式回归方法的机器学习方法进行了对哥伦比亚疾病共同19的分析研究。先前的分析已经对每天的病例,死亡,感染者和暴露于该病毒的人进行了分析,所有这些病例都在550天的时间表中所有人。此外,它使感染扩散的拟合详细介绍了较低的传播误差和统计偏差的最佳方法。最后,提出了四种不同的预防方案,以评估与该疾病有关的每个参数的比率。
translated by 谷歌翻译
目的:为Kern等人提出的正弦线圈灵敏度模型提供封闭形式的解决方案。这种封闭形式允许对地面DEBIAS数据集的各种模拟偏置字段进行精确计算。方法:使用傅立叶分布理论和标准积分技术来计算线段磁场的傅立叶变换。结果:a $ l^1 _ {\ rm loc}(\ mathbb {r}^3)$函数在任意线段的几何形状中以完整的通用性得出。还讨论了采样标准和与原始正弦模型的等效性。最后,作者提供了CUDA加速实现$ \ texttt {biasgen} $。结论:由于派生的结果受到线圈定位和几何形状的影响,从业者将可以访问更多样化的模拟数据集生态系统,这些数据集可用于比较前瞻性偏见方法。
translated by 谷歌翻译
依赖图被证明是一个非常成功的模型,可以代表人类语言句子的句法结构。在这些图中,被广泛接受为树,顶点是单词,而弧线连接了句法依赖的单词。这些依赖关系的趋势已使用随机基线来证明边缘或其变体的长度之和。无处不在的基线是投影订单中的预期总和(其中边缘不交叉,句子的词根不涵盖任何边缘)。结果表明,可以以$ o(n)$时间计算所述期望值。在本文中,我们重点介绍平面顺序(可以涵盖词根单词),并提出两个主要结果。首先,我们显示了平面布置中的预期总和与投影安排中的预期总和之间的关系。其次,我们还得出了$ o(n)$ - 时间算法来计算边缘长度总和的预期值。这两个结果源于本文的另一项贡献,即平面的表征,鉴于句子,它产生了平面排列的数量或有效的算法,以生成单词的均匀随机平面排列。我们的研究铺平了为使用随机平面线性化作为随机基线的随机平面线性化而复制过去的研究研究的道路。
translated by 谷歌翻译
掌握进行手术所需的技术技能是一项极具挑战性的任务。基于视频的评估使外科医生可以收到有关其技术技能的反馈,以促进学习和发展。目前,此反馈主要来自手动视频评论,该视频审查是耗时的,限制了在许多情况下跟踪外科医生进展的可行性。在这项工作中,我们引入了一种基于运动的方法,以自动评估手术病例视频饲料的手术技能。拟议的管道首先可靠地轨道轨迹,以创建运动轨迹,然后使用这些轨迹来预测外科医生的技术技能水平。跟踪算法采用了一个简单而有效的重新识别模块,与其他最新方法相比,它可以改善ID-开关。这对于创建可靠的工具轨迹至关重要,当仪器定期在屏幕上和屏幕外移动或定期遮盖。基于运动的分类模型采用最先进的自我发明变压器网络来捕获对技能评估至关重要的短期和长期运动模式。在体内(Cholec80)数据集上评估了所提出的方法,其中专家评级的目标技能评估对Calot三角解剖的评估被用作定量技能度量。我们将基于变压器的技能评估与传统的机器学习方法进行比较,并使用拟议的和最新的跟踪方法进行比较。我们的结果表明,使用可靠跟踪方法的运动轨迹对仅根据视频流进行评估的外科医生技能是有益的。
translated by 谷歌翻译